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摘 E: 以 古 尔 班 通 古 特 沙漠 为 研究 对 象 ,采用 2019 年 AMSR-2 的 4 通道 被 动 微波 亮 温 及 MODIS 植 被 指数 ,探索 


Catboost 算 法 对 被 动 微波 地 表 温 度 空 间 降 尺 度 的 可 行 性 ,填补 古 尔 班 通 古 特 沙 漠 MYD11A1 的 缺失 像 元 ,为 获取 全 
天 候 日 .夜间 多 层 土壤 温度 提供 数据 参考 。 结 果 表 明 :(1) 古 尔 班 通 古 特 沙 漠 日 .夜间 用 于 降 尺 度 研究 的 特征 向 量 
(23.8 GHz V 36.5 GHz V,18.7 GHz H .89 GHz V ,36.5-23.8 GHz V .36.5 V-18.7 GHz H EVINDVIT) 与 地 表 温 度 的 相 


关 性 空间 分 异 特征 明显 ,显示 沙漠 相关 性 高 ,绿洲 相关 人 必 


E 低 , 且 日 间 分 异性 更 强 ; 而 盐 矿 覆盖 会 降低 微波 与 地 表 温 


度 相关 性 ,(2) Catboost 4 通道 模型 建立 的 被 动 微波 亮 温 与 地 表 温 度 间 映射 关系 表现 出 鲁 棱 性 。 降 尺度 结果 精度 较 
高 ,日 夜间 尺 分 别 为 0.977、0.980,RMSE 分 别 为 3.69 KK、2.38 民 ,MAFE 分 别 为 2.71 K、1.70 K, (3) 单 通 道 相 关 性 统计 结 


果 与 重要 性 分 析 结果 存在 差异 ,表明 特征 因子 相关 性 统计 结果 不 能 直接 作为 Catboost 被 动 微波 反 演 地 表 温度 特征 


选择 依据 。(4) 降 尺 度 结果 与 站 点 6 层 土壤 温度 均 呈 极 ! 


RMSE 呈 增 加 趋势 。 


! 著 正 相关 ,并 随 着 深度 的 增加 相关 系数 "总 体 呈 下 降 趋势 ， 
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地 表 温 度 (Land Surface Temperature, LST) 作 为 
长 波 辐射 与 地 气 潮流 热 通 量 交换 的 直接 驱动 力 "， 
是 反映 区 域 乃 至 全 球 尺度 水 热平衡 的 重要 参数 之 
一 中 ,及 时 有 效 地 获取 区 域 地 表 温度 信息 对 气候 、 农 
业 研 究 具有 重要 的 现实 意义 ” deii E GJ E 
用 于 城市 热岛 效应 中 干旱 监测 "能量 平衡 评估 "1、 
蒸 散发 汪 等 研究 领域 。 由 于 地 形 土壤、 植被 .天 
气 等 因素 的 复杂 性 ,造成 地 表 温 度 空间 上 具有 异 质 
性 ” ,时 间 上 具有 波动 性 ,需要 高 时 空 分 辨 率 的 数据 
描述 地 表 温 度 的 空间 分 布 及 时 间 演 变 。 目 前 ,包括 
MODIS 5 AVHRR 在 内 的 热 红外 及 其 他 光学 遥感 畏 
空地 表 温 度 反 演算 法 已 达 较 高 精度 ”" ,但 非 晴 空 
区 域 反 演 受 天 气 影响 严重 ,如 中 纬度 地 区 MODIS 数 
据 超过 60% 被 天 气 影 响 , 云 为 最 主要 原因 ""。 微 波 
通道 能 穿 透 云 层 , 受 大 气 影响 较 弱 ,可 获取 复杂 天 
气 状况 下 的 地 表 辐 射 信息 ,但 其 空间 分 辨 率 较 
低 , 在 区 域 尺 度 研 究 中 需 融 合 其 他 数据 来 提高 空间 
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分 辨 率 。 微 波 地 表 温 度 空 间 降 尺度 是 指 在 确定 低 
空间 分 辩 率 微波 像 元 值 的 基础 上 ,融合 高 空间 分 辩 
率 地 表 温 度 信 息 ,使 得 微波 全 天 候 观 测 地 表 温 度 的 
同时 ,获取 更 多 的 细节 信息 ”。 

辐射 传输 理论 是 多 通道 被 动 微波 反 演 地 表 温 
度 的 物理 基础 ,但 为 病态 反 演 , 且 部 分 参数 机 理 有 
竺 明确“"。 基 于 物理 过 程 的 半 经 验 反 演算 法 对 被 
动 微波 反 演 地 表 温 度 具 有 重要 意义 。 最 早 , McFar- 
land $£" P4 SSM/I (Special Sensor Microwave/Imager ) 
为 数据 源 ,通过 多 元 线性 回归 对 地 表 温 度 反 演 ,发 
现 37 GHz 与 地 表 温 度 相关 性 最 高 ,其 他 通道 处 理 可 
FH TAE IEZKIAGE WI, Njoku , Gao 4$ AMSR-E 
为 数据 源 , 表 明 36.5 GHz 3f EA Ey Hb RE ec EE 
反 演 通道 ,受到 大 气 影响 较 小 ,能 够 获取 浅 层 温度 
言 息 ,但 裸 地 的 低 含水 量 及 散射 作用 会 降低 微波 反 
演 的 精度 。Mao "2 等 以 AMSR-E 为 数据 源 ,建立 单 
通道 亮 温 与 MODIS 地 表 温 度 之 间 的 关系 ,得 出 89 
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GHz 垂直 极 化 相关 性 最 高 ,36 GHz 垂直 极 化 与 18 
GHz 水 平 极 化 和 23 GHz H ECL FER 28 2 200 B8 59 H4 
除 地 表 和 大 气 水 分 对 地 表 温 度 反 演 的 影响 ,在 此 基 
础 上 建立 经 典 的 4 通道 算法 。 近 年 机 带 学 习 模 型 为 
解决 此 问题 提供 了 新 的 思路 ,Sun2 , Tan 7 等 分 别 
使 用 回归 树 与 卷 积 神经 网 络 融合 AMSR-2 多 通道 亮 
温 对 美国 和 中 国 全 天 候 地 表 温 度 进行 了 反 演 ,取得 
了 较 好 的 结果 。 机 带 学 习 主 要 是 基于 数值 关系 算 
法 ,能 充分 利用 被 动 微波 亮 温 的 多 通道 信息 ,达到 
较 高 的 反 演 精度 ,但 单纯 的 机 器 学 习 方 式 ,缺乏 对 
通道 的 选择 及 其 物理 意义 的 分 析 ,结果 的 无 法 解释 
性 可 能 限制 其 进一步 应 用 。 新 的 机 带 学 习 算法 往 
往 能 够 推动 半 经 验 反 演 模型 的 发 展 。Catboost( Cat- 
egorical boosting) Z& Yandex 于 2017 年 提出 的 一 种 新 
的 GBDT(Gradient Boosting Decision Tree) £& EVER 
法 ,精度 与 稳定 性 均 高 于 随机 和 森林 与 支持 向 量 机 ”， 
能 够 改善 以 往 GBDT 算 法 (如 LightGBM , XGboost ) HY 
过 度 拟 合 问题 ,已 逐渐 应 用 于 蒸 散发 反 演 ”土地 
分 类 ”等 研究 。 目 前 ,基于 Catboost 算 法 的 遥感 研 
究 相 对 较 少 ,因此 本 研究 结合 Catboost 算 法 与 4 通道 
组 合 ,探索 基于 半 经 验 模 型 的 被 动 微 波 地 表 温 度 降 
尺度 方法 。 

古 尔 班 通 古 特 沙漠 区 站 点 稀少 ,地 表 温 度数 据 
稀缺 , 仪 有 位 于 南 缘 绿洲 区 的 新 疆 阜 康 荒漠 生态 系 
统 国 家 野外 科学 观测 研究 站 (简称 量 康 荒漠 生态 
站 ), 难 以 满足 模型 对 输入 数据 的 要 求 ; 且 沙 漠 区 域 


1 研究 区 概况 示意 网 


Fig. 1 Overview of study area 


遥感 地 表 温 度 产品 受 云 影响 严重 ,2019 年 MODI 地 
表 温 度 产 品 日 夜间 云 覆盖 率 分 别 达 63.0% ,65.996 , 
时 间 空间 上 的 不 连续 ,严重 影响 了 数据 的 使 用 及 
进一步 人 研究。 本 文 以 古 尔 班 通 古 特 沙漠 为 研究 区 , 
通过 Catboost 算 法 建立 基于 空间 结构 相似 性 的 精细 
图 像 与 粗 图 像 之 间 的 非 线 性 映射 关系 ,将 AMSR-2 
数据 融入 到 地 表 温 度 降 尺 度 研究 中 ,为 古 尔 班 通 古 
特 沙漠 提供 全 天 候 高 空间 分 辩 率 的 地 表 温 度 产 品 ， 
拓宽 Catboost 算法 应 用 领域 ,为 数据 稀缺 区 地 表 温 
度 获取 提供 有 效 的 方法 。 


1 数据 与 方法 


1.1 研究 区 概况 

Th AR BE Ty Re DP ThE (44° 15’ ~46°5’N, 84°50! ~ 
91°20’ E)E FER £8 A (E 1), bz PES OB d 
地 中 部 , 玛 纳 斯 河流 域 以 东 及 乌 伦 古河 以 南 地 区 , 
HFR 4.88X 10* km, EXE VP Fr Z8 8E Jg VPE , 占 沙 漠 
IRA 80967", Jgi SR FEY rri CR T e CTS FE 
受 西 风 带 控制 , 受 此 影响 纵向 沙丘 从 西北 向 东南 移 
动 。 全 年 平均 气温 5~5.7 *C ,昼夜 温差 10~30 CT, 
端 气 温 最 高 可 达 41.7 % ,最 低 可 至 -31 C, EE 
蒸发 量 为 2000~2800 mm ,降水 主要 集中 于 5 一 9 月 ， 
降水 量 < 220 mm, 沙漠 腹地 低 至 70~100 mm, & Æ 
积 雪 深度 约 30 em?" , 受 此 影响 春 夏 季 短 命 植物 生 
长 旺盛 。 


图 例 

o 盐湖 

e 观测 站 点 
海拔 高 度 /m 
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1.2 数据 来 源 与 处 理 

1.2.1 Raye HL 2019 4E GCOM-W 卫星 AM- 
SR-2 (GAT LIR Zi A Aqua 卫星 MODIS 传 感 
器 的 MYD13A3 数 据 集 作为 Catboost 模 型 特征 向 量 ， 
MYDI1A1 数据 作为 模型 训练 的 目标 向 量 ( 表 1)。 

LIR 数据 集 由 JAXA (http://gportal.jaxa.jp ) 提 供 ， 
共 包 括 6.9 GHz .10.7 GHz、18.7 GHz .23.8 GHz,36.5 
GHz 和 89.0 GHz 频率 垂直 与 水 平 极 化 的 14 个 通 
道 。 根 据 Mao 等 ”4 通道 算法 ,选取 36.5 GHzV 亮 
温 为 温度 反 演 的 主导 因子 ;23.8 GHz V 与 18.7 GHz 
H 的 亮 温 作为 辅助 数据 ,以 消除 大 气 .地 表 水 等 影 
响 ;89 GHz V 消除 其 他 因素 的 平均 影响 。 单 个 扫描 
周期 (16 d) 共 14 d 过 境 研究 区 ,过 境 时 间 约 在 日 间 
15:00, f la] 4:00。MYD13A2 5j MYD11A1 数据 由 
LADDC 提供 。MYD13A2 为 16 d 合 成 增强 植被 指数 
(Enhanced Vegetation Index, EVI) 与 归 一 化 植被 指 
数 (Normalized Vegetation Index, NDVI), MYD11A1 
为 日 尺度 地 表 温 度数 据 。 

AMSR-2 被 动 微波 亮 温 与 MODIS-Aqua 数据 集 
获取 时 间 相 近 ,研究 区 二 者 单个 扫描 周期 内 每 天 过 
境 时 间 差 < 15 min ,可 减少 因 观测 时 间 错 位 引起 的 
误差 ;MYD11A1 由 于 云 影响 , 像 元 缺失 严重 ,因此 选 
用 未 被 云 影响 且 质 量 控制 average LST error«1 K 的 
MYD11A1 像 元 与 AMSR-2 被 动 微波 数据 集 建立 映 
HRZ- 

1.2.2 地 表 实 测 数据 FIERREN (87°33'36"E, 
44°10'30"N ) 位 于 古 尔 班 通 古 特 沙漠 南 缘 ,是 绿洲 荒 
漠 过 渡 区 ,地 面 植被 较为 茂 感 , 多 以 荒漠 草原 和 草 
WERA” ,平均 海拔 461 m, 提供 每 日 逐 时 6 层 
地 表 温 度数 据 (分 别 中 地表 5 cm 、10 cm 、20 cm 40 
cm,80 cm,160 cm)。 由 于 AMSR-2 扫 描 间 际 的 存在 
及 自动 站 采集 探头 不 明 原 因 导 致 的 数据 缺失 , 共 选 
白天 264 条、 夜间 270 条 数据 参与 地 表 温 度 验证 。 
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自动 站 数据 由 国家 生态 科学 中 心 提供 (http://rs.cem. 
ac.cn/index.jsp) o 

1.2.3 数据 处 理 选取 被 动 微波 36.5 GHz V .23.8 
GHz V,18.7 GHz H,89 GHzV 亮 温 通 道 为 特征 向 量 
进行 组 合 变换 ,MYD13A2 植被 指数 作为 辅助 数据 ， 
构建 基于 Catboost 的 半 经 验 被 动 微 波 降 尺度 模型 ， 
将 10 km 分辩 率 被 动 微波 亮 温 降 尺度 为 1 km 分 辩 率 
地 表 温 度数 据 。AMSR-2 日 间 与 夜间 地 表 温 度 降 尺 
度 具 体 步 又 如 下 : 

(D 将 AMSR-2 与 MODIS 数据 通过 最 近邻 法 统 
一 重 采样 至 10 km, HEAR MYDITAT 质量 average LST 
error«l K 的 像 元 匹配 AMSR-2 微波 亮 温 数据 及 
MYD13A2 植 被 指数 数据 。 

(2) 降 尺 度 特征 向 量 的 空间 相关 性 统计 方法 。 
在 10 km 空间 分 辨 率 下 ,6 个 AMSR-2 被 动 微波 亮 温 
通道 (4 个 原始 单 通 道 和 2 个 组 合 通道 ) 及 2 个 
MYD13A3 植被 指数 与 MYD11A1 ,在 全 年 尺度 (365 
d) 上 进行 单个 像 元 位 置 的 Pearson 相关 分 析 ,获取 各 
个 特征 向 量 的 相关 系数 + 及 概率 P 数 据 , 绘 制 相关 系 
数 r 空 间 分 布 图 (图 2); 对 研究 区 内 相关 系数 + 进行 
统计 分 析 ,绘制 相关 系数 > 频率 分 布 图 (图 3)。 进 而 
分 析 各 特征 因子 与 地 表 温 度 的 相关 性 及 相关 性 的 
空间 特征 。 

(3) Ctboost 4 通道 模型 十 折 交 叉 验 证 。 基 于 前 
人 研究 成 果 及 相关 性 空间 统计 分 析 ,选取 4 通道 半 
Zt Ws [6] HE A & ^7 (36.5 GHz V 、36.5-23.8 GHz V, 
36.5 V-18.7 GHz H,89 GHz V) 444 MYD13A3 增强 
植被 指数 训练 Catboost 模 型 ,构建 各 特征 因子 与 地 表 
温度 间 的 映射 关系 。 通 过 “十 折 交 又 验 证 ”方案 1 
(10-fold cross-validation ) 评 估 模 型 。 

D 基 于 空间 相似 性 的 地 表 温 度 降 尺度 。 将 被 
动 微 波 亮 温 通过 最 近邻 算法 重 采 样 至 1 km ,与 对 应 
像 元 的 1 km MYD13A3 植 被 指数 组 成 特征 向 量 , 输 


表 1 AMSR-2 与 MODIS 相关 数据 参数 
Tab. 1 The information of AMSR-2 microwave brightness temperature and MODIS data 


AMSR-2 被 动 微波 亮 温 数据 MODIS Eit 
中 心 频率 /GHz 极 化 方式 空间 分 辨 率 /km FEX TUTTI zu 
18.7 V/H 10 ET 
MYD 11AI 1 LST Day. l km 
iid ie M QC Day 
36.5 V/H 10 - 
MYD 13A2 1 ] km 16 days EVI 
2 = 2 1 km_16_days_NDVI 


注 :H 代 表 水 平 极 化 ,V 代 表 垂 直 极 化 。 
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23.8 GHz V 


23.8 GHz V 
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图 2 日 (a)\ 夜 (b) 间 各 特 和 


36.5 GHzV 89 GHz V 


0.9 1.0 


F 因 子 相 关 性 的 空间 分 布 


Fig.2 Factors’ correlations spatial distribution maps in the daytime (a) and nighttime (b) 


AZ 10 km 空间 尺度 上 训练 完成 的 Catboost 模 型 , 基 
于 不 同 尺度 空间 结构 相似 性 反 演 1 km 空间 分 辨 率 
的 地 表 温 度数 据 。 

O 降 尺 度 结果 的 精度 验证 及 特征 因子 的 重要 
生 评价 。 选 用 1 km 空间 分 辩 率 质量 控制 average 
LST error < 1 K FY MODIS 晴空 像 元 ,对 降 尺 度 结 
进行 精度 验证 ;对 模型 因子 进行 重要 性 分 析 。 

© 降 尺 度 结果 的 多 层 地 温 相 关 性 分 析 。 通 过 
旱 康 若 漠 生态 站 6 层 地 温 数据 与 对 应 位 置 的 降 尺 度 
结果 进行 相关 性 分 析 , 通 过 +、P、RMSE (Root Mean 
Square Error) 对 相关 性 结果 进行 评价 。 

D 将 基于 Catboost 半 经 验 模型 降 尺 度 的 被 动 微 


= 


波 地 表 温 度 与 MODIS 质量 控制 后 的 晴空 像 元 融合 ， 
填补 MODIS 地 表 温 度 缺 失 像 元 ,得 到 全 天 候 的 地 表 
温度 产品 。 

基于 AMSR-2 被 动 微波 亮度 温度 的 全 天 候 地 表 
温度 降 尺 度 技术 路 线 如 图 4。 
1.3 研究 方法 
1.3.1 微波 地 表 温 度 反 演 的 辐射 传输 模型 ”被 动 
微波 观测 反 演 地 表 温 度 的 物理 基础 为 辐射 传输 理 
论 ' 中 ,通过 辐射 能 量 平 衡 建立 地 表 温 度 反 演算 法 。 
辐射 传输 方程 描述 了 被 动 微 波 辐射 计 接 收 到 的 总 
能 量 ,包括 地 面 辐射 和 向 上 、 向 下 的 大 气 路 径 辐射 
以 及 由 大 气 吸 收 而 减弱 的 辐射 分 量 “ “2 ,通用 辐射 
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图 3 日 (a)\ 夜 (b) 间 各 特征 因子 相关 性 的 频率 统计 
Fig.3 Day (a) and night (b) correlations histogram of each factor 
传输 方程 表示 如 下 ; LST=|T, - ars, - à =b- a) (C); /lor,(0)] (2) 


B(T,)=7,O)e,B,(T,) * [1 - z,(6)] 
(t -e, (6) (T:) + [1 - ,6)]8,(T. 
式 中 :了 ,代表 地 表 温 度 ; T, 代表 平均 大 气温 度 ; 了 
代表 频率 的 亮度 温度 ; O 代表 S 频率 在 观测 
角 0 的 透射 率 ; e, 代表 f 频率 的 地 表 发 射 率 ; 


(1) 


B(T) 代表 地 表 辐 射 ; T 与 7 分 别 为 大 气 下 行 与 


上 行 辐射 。 

基于 多 通道 御 射 传输 方程 反 演 地 表 温度 ,每 加 
入 1 个 通道 ,将 加 入 1 个 新 的 未 知 数 ,N 个 通道 加 入 
时 ,有 N+1 个 未 知 数 ,因此 基于 被 动 微波 的 物理 模 
型 的 地 表 温 度 反 演 为 病态 反 演 "*“。 为 解决 此 问 
题 ,Fily 等 学 者 假设 同一 频率 下 垂直 极 化 发 射 率 e， 
与 水 平 极 化 发 射 率 e, 可 简化 为 线性 关系 
e, 2ae, +b RIRU, RART REA: 


式 中 :为 线性 回归 系数 ; T, 为 微波 亮 温 值 ; 的 
下 标 V 五 分 别 代表 垂直 极 化 与 水 平 极 化 。 但 是 这 
种 假设 简化 了 先决 条 件 , 如 恒定 的 大 气 校正 、 im 
植被 的 吸收 忽略 大 气 散射 效应 等 3。 

1.3.2 Catboost 一 一 被 动 微波 地 表 温 度 反 演 的 机 器 
学 习 模 型 ”通过 机 融 学 习 方 法 多 通道 微波 亮 温 反 
演 地 表 温 度 ,避免 了 简化 垂直 与 水 平 亮 温 的 相互 关 
ZR , 较 好 地 解决 病态 反 演 问题 。Catboost 是 在 XG- 
boost , LightBMG 等 基础 上 新 提出 的 一 种 GBDT 算 
法 ,能 够 较 好 的 解决 复杂 的 数据 异 构 .噪声 高 . 特 
征 相 互 依赖 等 问题 潮 。Catboost 模 型 中 特征 向 量 提 
供 信 息 高 于 目标 向 量 ”, 而 传统 的 GBDT 算 法 通过 
平均 目标 向 量 来 作为 节点 分 割 的 准则 3, 因此 Cat- 
boost 能 够 利用 到 特征 之 间 的 联系 ,丰富 特征 维度 ， 
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图 4 AMSR-2 全 天 候 地 表 温 度 降 尺度 流程 图 
Fig. 4 Flow chart of the method for AMSR-2 all-weather 


land surface temperature downscaling 


降低 低频 目标 向 量 对 结果 影响 ;其 为 一 种 贪 禁 的 机 
器 学 习 方式 ,结合 所 有 特征 及 所 有 特征 组 合 建立 决 
策 树 四 ;此 外 ,其 通过 排序 梯度 提升 ,添加 先 验 分 布 
项 ,去 除 训 练 集中 噪声 数据 ,克服 传统 GBDT 的 过 拟 
合 问题 ,解决 预测 梯度 偏 移 ”” 。 

在 模型 实际 运行 中 , 贪 禁 的 学 习 方式 导致 每 迭 
代 一 次 ,都 对 目标 变量 进行 统计 分 组 ,以 及 密集 的 
数值 特征 将 导致 建立 决策 树 的 高 计算 负担 。 但 以 
上 问题 在 python 接口 Catboost 算法 通过 GPU 克服 ， 
且 该 算法 文 持 多 个 GPU 线程 工作 ,分布 式 树 学 习 实 
现 对 数据 或 特征 并 行 处 理 。AMSR-2 被 动 微波 亮 温 
具有 多 频率 、 双 极 化 特征 ,Catboost 算 法 能 够 在 保证 
提取 多 通道 特征 的 同时 提高 学 习 效 率 。 
1.3.3 ”验证 方法 ”本 人 研究 基于 Catboost 模 型 ,对 4 通 
道 组 合 向 量 进行 训练 ,构建 被 动 微波 亮 温 、 植 被 指 
数 与 MODIS 地 表 温 度 之 间 的 映射 关系 。Catboost 算 
法 的 4 通道 模型 初步 评估 ,选用 “十 折 交 又 验 证 
方案 。 十 折 交 又 验证 之 初 在 统计 学 中 用 来 测试 算 
法 模型 的 准确 性 。 将 古 尔 班 通 古 特 沙 漠 的 训练 数 
据 随机 分 为 10 组 ,循环 地 将 其 中 9 组 作为 训练 数据 
拟 合 模型 ,其 余 的 1 组 作为 验证 。 将 10 次 的 拟 合 精 
度 均 值 作为 本 模型 的 最 终 精 度 。 采 用 十 折 交 叉 验 


证 能 够 有 效 降低 系统 误差 、 随 机 误差 和 粗 差 ,使 模 
型 测试 的 精密 度 达到 理论 上 的 最 高 “> 。 

特征 向 量 的 空间 相关 性 统计 分 析 。 在 像 元 义 
度 进行 皮尔 逊 相关 分 析 ,获取 各 个 特征 向 量 的 相关 
系数 + 及 概率 P, 绘 制 相关 系数 + 空间 分 布 图 ,分 析 各 
特征 因子 与 地 表 温 度 相 关 性 的 统计 特征 及 空间 特 
征 。 将 决定 系数 记 (Coefficient of determination ) . 平 
均 绝 对 误差 MAE (Mean absolute error) 和 均 方 根 误 
差 RMSE 作 为 Catboost 模 型 评价 指标 ,进行 超 参 数 搜 
索 .验证 及 对 比 。 

模型 的 构建 与 评价 分 为 3 步 :(1) 以 MYD11AI1 
作为 目标 向 量 的 Catboost 模型 构建 ,通过 其 Python 
接口 输出 Catboost 4 通道 模型 的 十 折 交 叉 验 证 ,对 模 
型 进行 初步 评价 ; (2) 根据 Catboost 4 通道 模型 ,将 
降 尺 度 后 的 1 km 地表 温 度数 据 与 MYD11A1 晴空 像 
元 对 比分 析 ,评价 精度 ; (3) 将 降 尺 度 地 温 与 站 点 6 
层 地 温 分析 , 确 定 各 层 土 温 与 被 动 微波 降 尺 度 地 表 
温度 相关 性 。 


2 结果 分 析 


21 降 尺 度 特 征 向 量 空间 相关 性 统计 分 析 

从 相关 性 的 空间 分 布 ( 图 2) 及 相关 性 的 频率 统 
计 ( 图 3 ) 两 方面 对 特征 因子 与 地 表 温 度 的 相互 关系 
分 析 表 明 : 

(1) 古 尔 班 通 古 特 沙漠 日 .夜间 单 通 道 微波 与 
地 表 温 度 的 相关 性 呈现 绿洲 沙漠 分 异 显 著 , 主 要 
表现 为 沙洲 内 部 相关 性 较 高 ,周边 绿洲 较 低 ; 与 夜 
间 相 关 性 空间 特征 相 比 ,日 间 的 绿洲 与 沙漠 分 异性 
更 强 。 

(2) EVI 与 NDVI 相 关 性 空间 特征 相似 ,能 较 好 
描述 沙漠 与 周边 绿洲 分 异性 (沙漠 区 > 绿洲 区 ) ,但 
描述 能 力 低 于 单 通 道 亮 温 ;相关 性 均值 EVI>NDVI 
(日 间 EVI 与 NDVI 分 别 为 0.76、0.74, 夜 间 分 别 为 
0.808 .0.798) ,因此 在 模型 构建 中 选用 EVI 作 为 模型 
构建 的 辅助 数据 。 

(3) 区 域 各 特征 因子 相关 性 均值 日 间 :23.8 
GHz V (0.98) >36.5 GHz V (0.95) >18.7 GHz H 
(0.94) > 89 GHz V(0.93),36.5-23.8 GHz V(0.31) > 
36.5 V- 18.7 GHz H( - 0.02) , EVI (0.76) » NDVI 
(0.74) ; XZE] :23.8 GHz V (0.96) > 36.5 GHz(0.94) > 
89 GHz (0.93) > 18.7 GHz (0.86) , 36.5-23.8 GHz V 
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(0.20) > 36.5 V-18.7 GHz H(-0.16) , EVI(0.808) > 
NDVI(0.798) , 

36.5 V-18.7 HH 的 通道 组 合 与 地 表 温 度 相关 性 
空间 特征 日 夜间 差异 较 大 ,上 且 分 布 完全 相反 。 这 可 
能 是 由 日 夜间 沙漠 区 地 表 水 分 差异 引起 , 沙漠 日 夜 
间 地 表 温 度 差 异 较 大 ,日 间 迅 速 增 温 ,达到 较 高 温 
度 , 沙 漠 化 严重 的 西部 水 分 蒸发 缺失 严重 ,而 有 稀 
玻 植 被 覆盖 的 东部 水 分 蒸发 较 少 ,因此 相关 性 空间 
特征 东西 差异 较 大 。 夜 间 低 温 促进 空气 水 分 向 地 
表 水 分 运动 ,沙漠 化 严重 的 西部 降温 较 快 ,有 稀 踢 
植被 覆盖 的 东部 较 慢 ,因此 卫星 过 境 时 (北京 时 间 
4:00) 西 部 地 表 水 分 高 于 东部 。 此 结果 印证 36.5 V- 
18.7 HH 与 地 表 水 分 具有 较 高 的 相关 性 »。36.5 V- 
23.8 量 在 周边 绿洲 与 地 表 温 度 呈 负 相 关 , 沙 漠 内 部 
呈正 相关 ,其 相关 性 空间 特征 分 异性 显著 ,这 是 由 于 
36.5 V-23.8 HARARE SES | A 2 

在 像 元 尺度 对 相关 系数 六 概率 尸 进行 了 计算 ，， 
除 古 尔 班 通 古 特 沙漠 外 西北 方向 盐场 聚集 区 , 单 通 
道 概率 忆 均 呈 极 显著 水 平 , 表 明 盐 场 会 严重 影响 被 
动 微波 与 地 表 温 度 的 映射 关系 。 

2.2 Catboost 4 通道 模型 十 折 交 义 验 证 

十 折 交 义 验 证 结果 (图 $) 表 明 ,基于 Catboost 的 
4 通道 模型 能 够 较 好 地 构建 10 km 尺度 下 被 动 微波 
亮 温 与 地 表 温 度 之 间 的 映射 关系 , 旦 表现 出 鲁 棒 
PE HER MAE RMSE 均值 分 别 为 0.973 、2.95 K, 
3.80K, 夜 间 尼 .MAE RMSE 均值 分 别 为 0.964 .2.24 
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K、3.04 ,表明 日 夜间 4 通道 Catboost 模 型 精度 均 较 
高 , 泛 化 能 力 在 10 km 尺度 下 得 到 了 较 好 的 验证 , 且 
夜间 交叉 验证 结果 优 于 日 间 。 日 间 最 大 值 与 最 小 
值 差 分 别 为 0.001、0.07 K,0.13 下 ;夜间 最 大 值 与 最 
小 值 差分 别 为 0.001、0.04 K 0.06 K, H f [8] £7], 
表明 模型 具有 较 高 的 稳定 性 。 
2.3 降 尺 度 精 度 验证 及 特征 因子 重要 性 评估 
2.3.1 精度 验证 MODIS 为 像 元 尺度 (1 kmx1 km) 
的 降 尺 度 地 表 温 度 验证 提供 了 真 值 数据 , Wang 587^ 
获得 了 2000 一 2001 年 的 地 表 真 值 数据 ,对 MODIS 数 
据 进 行 了 评估 ,结果 表明 MODIS 的 地 表 温 度 产 品 精 
度 在 1K 以 内 ;于 文凭 等 ”以 黑河 流域 为 研究 区 对 
MODIS 地 表 温 度 产品 进行 精度 验证 ,表明 平均 绝对 
误差 小 于 2.2 K, 可 以 用 来 间接 评估 反 演 产品 的 质 
量 。 因 此 ,可 选取 MODIS 质量 average LST error < 1 
K 的 晴空 像 元 对 反 演 的 地 表 温 度 验证 。 

通过 MODIS 质量 average LST errors 1 K 的 晴空 
像 元 ,对 地 表 温 度 降 尺度 结果 进行 精度 验证 (图 6)， 
日 间 与 夜间 尼 分 别 为 0.977 .0.980,RMSE 分 别 为 
3.69 K 2.38 K, MAE 分 别 为 2.71 K、1.70 K。 表 明基 
于 4 通道 亮 温 的 Catboost 降 尺度 结果 具有 和 较 高 精度 ， 
可 满足 地 表 温 度 基 本 应 用 需求 。 

夜间 地 表 温 度 降 尺度 结果 精度 高 于 日 间 。 原 
可 能 是 古 尔 班 通 古 特 沙漠 日 间 升 温 较 快 ,日 间 过 
境 时 间 ( 约 15:00) 温 度 升 至 较 高 水 平 ,大气 .土壤 水 
分 随 温 度 升 高 降 至 较 低 水 平 , 因 此 ,4 通道 模型 消除 


误差 到 
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图 5 日 间 、 夜 间 Catboost 十 折 交 叉 验 证 结果 


Fig.5 The 10-fold cross-validation result of Catboost in day and night 
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图 6 基于 日 间 \ 夜 间 Catboost 半 经 验 模型 的 地 表 温度 降 尺 度 结果 与 MYD11A1 散 点 图 
Fig.6 The scatter plots for downscaled LST derived from day/night Catboost model with MYD11A1 


KA .地 表 水 分 干扰 的 优势 在 日 间 被 消 弱 ; 夜 间 过 
境 时 间 ( 约 4:00) 沙 漳 温 度 降 低 至 较 低 水 平 ,大 气 、 地 
表 水 分 随 温 度 降低 升 至 较 高 水 平 ,4 通道 模型 对 水 
汽 的 校正 效应 能 够 提高 LST 反 演 精 度 。 此 结果 与 
36.5 V-18.7 H 日 夜间 相关 性 分 析 一 致 。 

2.3.2 重要 性 分 析 ”由 图 7 可 知 ,日 间 特 征 向 量 重 
要 性 表现 为 :89 GHz V(37.7) > 36 GHz V(23.8) > 36 
GHz V-23 GHz V(15.6) > EVI(15.4) > 36-23 GHz V 
(7.5); 夜间 特征 向 量 重要 性 表现 为 :89 GHz V 
(47.2) > 36-23 GHz V(19.2) > 36 GHz V(13.3) > EVI 
(12.6) > 36-23 GHz V(7.8)。 

单 通道 相关 性 统计 结果 与 Catboost 重要 性 分 析 
结果 存在 差异 。 日 间 夜间 36 GHz 垂直 极 化 地 表 相 
关 性 均 高 于 89 GHz, 但 重要 性 分 析 中 ,89 GHz 高 于 
36 GHz 约 1.5~3 倍 。 日 间 36 GHz 与 地 表 温 度 的 相 
关 性 均值 (0.95) 高 于 夜间 相关 性 均值 (0.94) ,而 相 
较 于 日 间 重 要 性 ,夜间 降低 了 约 44%; 日 间 89 GHz 
与 地 表 温 度 的 相关 性 均值 (0.93) 与 夜间 相等 ,而 相 
较 于 日 间 重 要 性 ,夜间 89 GHz 占 比 增加 约 25%。 表 


特征 向 量 重 要 性 /% 


36 GHz V 36 GHz V- 36 GHz V- 89GHzV EVI 
23GHzH 18GHzH 


明 相 关 性 较 低 的 单 通道 可 能 为 多 通道 反 演 地 表 温 
度 提供 更 多 信息 , 且 单 微波 通道 与 地 表 温 度 的 相关 
性 高 低 不 能 作为 Catboost 模 型 反 演 地 表 温 度 特征 
子 选 择 的 依据 。 
2.4 降 尺 度 结果 的 6 层 地 温 相关 性 分 析 

由 于 不 同 微波 通道 的 穿 透 性 具有 较 大 差异 ， 
此 多 通道 亮 温 反 演 地 表 温 度数 据 , 往 往 缺 乏 对 反 演 
结果 深度 的 定量 描述 ,因此 选取 皇 康 荒漠 生态 站 6 
层 地 温 数据 与 对 应 位 置 的 降 尺 度 结果 进行 相关 性 
分 析 ( 图 8)。 日 夜间 降 尺 度 结 果 与 6 层 地 温 的 P< 
0.001, 星 极 显 著 相关 ;日 间 各 层 地 温 的 相关 性 (7)5 
cm (0.980) > 10 cm (0.977) > 15 cm (0.971) > 20 em 
(0.969) > 40 cm (0.957) > 100 em (0.899) ,夜间 各 层 
地 温 的 相关 性 (r)5 em (0.981) = 10 em (0.981) = 15 
cm(0.981) > 20 em(0.980) > 40 cm (0.975) > 100 cm 
(0.928) ,相关 性 r 均 在 0.8 以 上 , 呈 极 强 相 关 。 表 明 
日 夜间 各 深度 的 土壤 温度 , 均 与 AMSR-2 降 尺度 结 
果 具 有 较 高 的 相关 性 , 且 随 着 深度 的 增加 , 均 方 根 
误差 呈 增 长 趋势。 


36GHzV 36 GHz V- 36 GHz V- 89GHzV EVI 


23GHzH 18 GHz H 


图 7 日 间 (a) 夜间 (b) Catboost 半 经 验 地 表 温 度 降 尺度 模型 (4 通道 及 EVI) 重 要 性 分 析 
Fig.7 The importance bar of model (Catboost with 4 channels and EVI) feature vectors respectively in day (a) and night (b) 
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图 8 降 尺 度 结果 与 6 层 地 温 相 关 性 分 析 


Fig. 8 Correlation plot of downscaled temperature based on 6 layers station data 


日 夜间 反 演 结果 与 不 同 深度 相关 性 变化 差异 
主要 存在 于 $ 10.15.20 cm 的 4 层 。 日 间 卫 星 过 境 


表 温 度 的 拟 合 关系 优 于 回归 树 ; 且 在 被 动 微波 亮 温 
反 演 地 表 温 度 的 基础 上 进行 了 降 尺 度 研究 ,构建 了 


时 ( 约 15:00) ,太阳 辐射 能 量 使 土壤 各 层 温 度 分 异 显 
著 , 随 深度 增加 逐 层 降低 特征 ;夜间 过 境 时 ( 约 4:00)， 
土壤 缺乏 太阳 辐射 能 量 输入 ,各 层 土壤 温度 均 较 低 
且 分 异性 弱 。 多 层 地 温 的 相关 性 检验 结果 显示 , 降 
尺度 结果 与 各 层 土 壤 温 度 均 具有 较 高 的 相关 性 。 
此 结论 可 用 于 被 动 微波 亮 温 反 演 多 层 土 壤 温 度 提 
供 理论 依据 ,结合 本 研究 成 果 , 可 以 避免 热 红外 遥 
感 的 云 强 干扰 ,获取 全 天 候 的 每 天 昼夜 2 次 观测 的 6 
层 温度 产 品 。 
2.5 基于 Catboost 的 昼夜 全 天 候 地 表 温 度 产品 
通过 融合 AMSR-2 亮 温 反 演 得 到 日 尺度 的 地 表 
温度 数据 ,填补 MODIS 由 云 导 致 的 地 表 温 度 空 缺 像 
元 ,获得 地 表 温度 产品 (图 9)。 当 晴空 时 ,使 用 MO- 
DIS 提供 的 LST 像 元 值 , 当 有 云 十 出 现时 ,使 用 AM- 
SR-2 微波 亮 温 的 反 演 地 表 温 度 。 以 8 月 13 日 与 8 
月 14 日 连续 2 d 为 例 进行 展示 ,通过 数据 融合 在 昼 
夜 尺度 上 获取 了 时 间 空间 连续 的 地 表 温 度 产 品 。 


3 讨论 


比较 Tan 等 基于 卷 积 神经 网 络 垂直 极 化 微波 
地 表 温 度 反 演 精度 ,本 研究 的 尼 提 高 了 0.08, RMSE 
降低 了 0.39 ,但 是 较 全 波段 反 演 精度 较 低 , 且 本 文 
增加 了 夜间 地 表 温 度 的 反 演 。 较 Sun 等 ”的 4 通道 
回归 和 树 的 算法 ,日 间 、 夜 间 尼 分 别 增加 了 0.075、 
0.076, RMSE 分 别 减 少 了 0.14 K,0.55 K, MAE 分 别 
减少 了 0.3 K、0.43 K; 与 该 文章 均 表 明 夜 间 的 精度 
高 于 日 间 , 且 对 比 证 明 Catboost 对 于 被 动 微波 与 地 


云 下 地 表 温 度 像 元 。 此 外 ,吸纳 Huang 等 "1 的 研究 
想法 ,将 遥感 地 表 温 度 与 站 点 多 层 土壤 温度 建立 相 
关 关 系 , 反 演 多 层 地 温 。 通 过 被 动 微波 亮 温 反 演 的 
地 表 温 度 产品 与 多 层 站 点 土壤 温度 相关 性 尼 更 高 
(5 cm 处 达到 0.98) ,但 同时 RMSE 也 更 大 。 推 测 原 
因 在 于 6.9 GHz 最 大 干 沙 穿 透 深度 达 25 em, fie fle us 
好 的 获取 地 下 辐射 相关 信息 ,但 训练 的 目标 向 量 
(MYD11A1) 本 身 为 表层 温度 ,缺乏 深层 土壤 温度 数 
据 来 建立 映射 关系 。 


4 结论 


(1) 上 古 尔 班 通 古 特 沙 漠 日 夜间 各 特征 问 量 与 地 
表 温 度 的 相关 性 空间 分 异 明显 ,沙漠 相关 性 高 , 绿 
洲 相关 性 低 , 且 日 间 分 异性 更 强 ; 盐 矿 覆 六 会 降低 
微波 与 地 表 温 度 相关 性 。 区 域 各 特征 因子 相关 性 
均值 表现 为 日 间 :23.8 GHz V (0.98) >36.5 GHz V 
(0.95) 218.7 GHz H (0.94) > 89 GHz V (0.93) ,36.5 
GHz V-23.8 GHz V (0.31) >36.5 V- 187 GHz H 
(70.02) ,EVI(0.76) > NDVI(O.74) ;夜间 :23.8 GHz V 
(0.96) > 36.5 GHz(0.94) > 89 GHz(0.93) > 18.7 GHz 
(0.86) , 36.5 GHz V-23.8 GHz V (0.20) >36.5 V- 
18.7 GHz H(-0.16) ,EVI(0.80) > NDVI(0.79) 

(2) 十 折 交 叉 验 证 表明 Catboost 4 通道 模型 建 
立 的 被 劲 微波 亮 温 与 地 表 温 度 间 映射 关系 表现 出 
HEE, HE R (coefficient of determination) , MAE 
(Mean Absolute Error) , RMSE (Root Mean Square Er- 
ror)3 (84) 9] 73 0.973 2.95 K 3.80 K, Pla] R MAE, 
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YE: (a) 代表 1 km 分 辨 率 晴空 下 MODIS LST(K);(b) 代表 1 km 分 辩 率 AMSR-2 反 演 LST(K);(c) 代表 1 km 分 辨 率 MODIS 与 AMSR-2 融 合 LST(K)。 


图 9 全 天 候 地 表 温 度 产 品 合成 图 


Fig.9 The integrated all-weather LST 


RMSE 34 fti 4) 3l] Jy 0.964 ,2.24 K ,3.04 K , E HJ] REG 
度 均 较 高 。 日 间 最 大 值 与 最 小 值 差 分 别 为 0.001、 
0.07 K、0.13 kK; 夜间 最 大 值 与 最 小 值 差 分 别 为 
0.001 ,0.04 K 、0.06 ,日 夜间 均 较 小 ,表明 模型 具有 
较 高 的 稳定 性 。 

(3) 地 表 温 度 降 尺 度 结 果 有 具有 较 高 精度 , MO- 
DIS Js E H 4 [8] R^ 4) 1] JJ 0.977 0.980, RMSE 分 别 
293.69 K,2.38 K, MAE 3:9] X 2.71 K,1.70 K, BER 
度 结果 与 站 点 7 层 地 表 温 度 进行 了 验证 分 析 ,结果 
表明 与 站 点 6 层 土壤 温度 均 呈 极 显 著 正 相关 ,并 随 
着 深度 的 增加 相关 系数 + 总 体 呈 下 降 趋势 ,RMSE 呈 
增加 趋势 ,此 结果 为 可 微波 获取 全 天 候 日 ,夜间 多 


层 土壤 温度 提供 数值 参考 。 

(4) 单 通 道 相关 性 统计 结果 与 重要 性 分 析 结 
存在 差异 ,日 间 夜间 36 GHz 垂 直 极 化 地 表 相 关 性 
均 高 于 89 GHz,89 GHz 重 要 性 高 于 36 GHz 约 1.5~3 
fi. 日 间 36 GHz 与 地 表 温 度 的 相关 性 均值 (0.95) 
高 于 夜间 相关 性 均值 (0.94) ,而 相 较 于 日 间 重 要 性 ， 
夜间 降低 了 约 44%; 日 间 89GHz 与 地 表 温 度 的 相关 
性 均值 (0.93) 与 夜间 相等 ,而 相 较 于 日 间 重要 性 , 夜 
间 89 GHz 占 比 增加 约 25%。 表 明 特 征 因 子 相关 性 
统计 结果 不 能 直接 作为 Catboost 被动 微波 反 演 地 表 
温度 特征 选择 依据 。 此 外 ,各 因子 的 重要 性 分 析 对 
于 机 理 逆 向 评估 具有 重要 意义 。 
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Abstract: This study aimed to fill in the missing pixels of MYD11A1 in the Gurbantunggut Desert and provide a 
theoretical basis for obtaining all- weather and multilayer soil temperatures during daytime and nighttime. We 
explored the feasibility of the CatBoost algorithm for the spatial downscaling of passive microwave surface 
temperature by using the four-channel passive microwave brightness temperature and MODIS vegetation index of 
the 2019 AMSR-2. Results show that (1) the spatial differentiation between feature vectors and surface temperature 
is evident during daytime and nighttime in the Gurbantunggut Desert. It indicates high desert correlation, low 
oasis correlation, and strong daytime differentiation. The salt mine coverage reduces the correlation between 
passive microwave brightness temperature and surface temperature. (2) The mapping relation between the passive 
microwave brightness temperature and surface temperature from the four-channel CatBoost model is robust. The 
accuracy of the downscaled results is high, with daytime-nighttime R of 0.977 and 0.980, RMSE of 3.69 and 
2.38 K, and MAE of 2.71 K and 1.70 K, respectively. (3) Single- channel correlation and importance analysis 
results are different, suggesting that feature correlation results cannot be directly used as a basis for selecting 
surface temperature features with the CatBoost passive microwave inversion of LST. (4) Downscaling LST is 
significantly and positively correlated with the soil temperature in six layers from the Fukang site. The correlation 
coefficient decreases, and RMSE increases as depth increases. 
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